宇宙に存在する原子数を上回る状態を持つ極めて複雑なゲームの勝率をどう求めればよいでしょうか?解析的な数学が手に負えなくなるとき、私たちはコンピュータの実験室に頼ります。 シミュレーション:これは実験を通じて確率を経験的に求める手法であり、理論的な確率と現実世界への応用との橋渡しとして機能します。
実験の構造
すべてのシミュレーションの核心には確率過程の再現があります。閉形式の式を解くのではなく、繰り返しの試行によってシステムの挙動をシミュレートします。これらの物理的な結果を数学的データに変換するために、私たちは 指標変数を使用します。
結果を数量化するために、イベントの成功または失敗を捉える確率変数を定義します。例えばサイコロゲームでは:
$$X = \begin{cases} 1 & \text{サイコロの合計が6の場合} \\ 0 & \text{それ以外の場合} \end{cases}$$
スリーブルのようなより複雑なゲームでは、$i$ 番目の試行の結果を $X_i$ と定義します:
$$X_i = \begin{cases} 1 & \text{$i$ 番目のゲームで勝利した場合} \\ 0 & \text{それ以外の場合} \end{cases}$$
重要なのは、期待値 $E[X_i] = P\{\text{スリーブルでの勝利}\}$ となることです。
理論的収束
なぜこれでうまくいくのでしょうか?シミュレーションの有効性は 大数の強法則(SLLN)に依存しています。私たちの推定器は標本平均として定義されます:
$$\sum_{i=1}^n \frac{X_i}{n} = \frac{\text{勝利ゲーム数}}{\text{プレイゲーム数}}$$
これは不偏推定器です。大数の強法則により、$\sum_{i=1}^n \frac{X_i}{n}$ は確率1で、$n \to \infty$ のときに $P\{\text{スリーブルでの勝利}\}$ に収束することがわかっています。
例:スリーブルのパラドックス
非常に複雑なスリーブルゲームの正確な勝率を計算することを想像してください。デッキの状態数が膨大であるため、解析的な組み合わせ論はほぼ不可能です。代わりに、固定戦略を使ってコンピュータに $n = 1,000,000$ 回のゲームをプレイさせます。各ゲームの $X_i$ を追跡することで、勝利の割合が得られ、従来の数え上げ法では得られない高精度な勝率推定が可能になります。